apriori算法 python:使用Apriori算法挖掘高频项集的潜在关联 |
您所在的位置:网站首页 › python random函数用法 › apriori算法 python:使用Apriori算法挖掘高频项集的潜在关联 |
apriori算法 python:使用Apriori算法挖掘高频项集的潜在关联
作者:芒果雪泡 •
2023-03-10 13:37:10
• 阅读 5
Apriori算法是一种用于发现关联规则的算法,它可以帮助我们找出最受欢迎的项目组合。Apriori算法是一种基于概率的算法,它使用购买历史数据来发现最受欢迎的项目组合。 Apriori算法是一种用于发现关联规则的算法,它可以帮助我们找出最受欢迎的项目组合。Apriori算法是一种基于概率的算法,它使用购买历史数据来发现最受欢迎的项目组合。 Apriori算法是一种用于发现关联规则的算法,它可以帮助我们找出最受欢迎的项目组合。Apriori算法是一种基于概率的算法,它使用购买历史数据来发现最受欢迎的项目组合。 Apriori算法的工作原理如下: 1.计算每个项目的支持度,支持度是一个衡量项目流行程度的指标,它表示在所有交易中,该项目出现的概率。 2.计算每个项目对的支持度,支持度是一个衡量项目组合流行程度的指标,它表示在所有交易中,该项目组合出现的概率。 3.计算每个项目组合的置信度,置信度是一个衡量项目组合的可信度的指标,它表示在一个项目出现的情况下,另一个项目也出现的概率。 4.根据支持度和置信度,选择出具有最高置信度的项目组合。 下面是一个使用Python实现Apriori算法的示例代码: from itertools import combinations # 定义数据集 dataset = [['Milk', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'], ['Dill', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'], ['Milk', 'Apple', 'Kidney Beans', 'Eggs'], ['Milk', 'Unicorn', 'Corn', 'Kidney Beans', 'Yogurt'], ['Corn', 'Onion', 'Onion', 'Kidney Beans', 'Ice cream', 'Eggs']] # 支持度阈值 min_support = 0.6 # 创建一个字典,用于存储项目及其出现的次数 item_count = {} # 遍历数据集,计算每个项目出现的次数 for transaction in dataset: for item in transaction: if item not in item_count: item_count[item] = 1 else: 本站系公益性非盈利分享网址,本文来自用户投稿,不代表码文网立场,如若转载,请注明出处 python apriori apr rio python-3.x 赞 (43) |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |